home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 2783 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  2.1 KB

  1. Path: hydra.zrz.TU-Berlin.DE!rawneiha
  2. From: rawneiha@hydra.zrz.TU-Berlin.DE (Philipp Boerker)
  3. Newsgroups: comp.sys.amiga.programmer
  4. Subject: Re: TMapping again!
  5. Date: 5 Feb 1996 09:47:59 GMT
  6. Organization: Technical University of Berlin, Germany
  7. Message-ID: <4f4jof$h3b@news.cs.tu-berlin.de>
  8. References: <4d6v0t$3dt@maureen.teleport.com> <4dg4jk$km@news.cs.tu-berlin.de> <4dhvd5$5r2@maureen.teleport.com> <38232113@kone.fipnet.fi> <4e10ol$ck3@maureen.teleport.com> <4e2ku6$31m@news.cs.tu-berlin.de> <4eec27$pte@maureen.teleport.com>
  9. NNTP-Posting-Host: hydra.zrz.tu-berlin.de
  10. Mime-Version: 1.0
  11. Content-Type: text/plain; charset=iso-8859-1
  12. Content-Transfer-Encoding: 8bit
  13.  
  14. sschaem@teleport.com (Stephan Schaem) writes:
  15.  
  16. >Philipp Boerker (rawneiha@hydra.zrz.TU-Berlin.DE) wrote:
  17. >: sschaem@teleport.com (Stephan Schaem) writes:
  18.  
  19. >: >        repeat  8
  20. >: >        mw      D1,D2
  21. >: >        mb      D0,D2
  22. >: >        addx.l  d7,D0
  23. >: >        movea.l d2,a0
  24. >: >        addx.l  d6,D1
  25. >: >        mw      (A0),d3
  26. >: >        mw      D1,D2
  27. >: >        mb      D0,D2
  28. >: >        movea.l d2,a0
  29. >: >        mb      (A0),d3
  30. >: >        addx.l  d7,D0
  31. >: >        addx.l  d6,D1
  32. >: >        mw      d3,(a1)+
  33. >: >        endr
  34.  
  35.  
  36. >: I think mapping 2 pixels like you did is not optimal.
  37. >: [...]
  38.  
  39.  
  40. > 'proper' pipelining... or maximum overlape of bus and sequencer
  41. > activity for my test is as above. I didn't count paper cycles,
  42. > but saw my fps get improved when I do the above VS 2 move.b  ,(a1)+
  43.  
  44. > (BTW notice the instruction register usage, and the ordering. should
  45. > be optimal for a 060 and take the best advantage of overlap in the
  46. > case of a 2 move.b to mem version)
  47.  
  48. The ordering can still be optimized for 060:
  49. mw d1,d2 & mb d0,d2 have an data dependency. You could put one of the addx's
  50. in between.
  51.  
  52. > I agree about doing word read can cross long boundary and require 2
  53. > access... But if its a problem on other usage of the loop above
  54. > Its so simple to make it write to (a1)+ vs d3.
  55.  
  56. Have you tried to do
  57. mb (a0),d3
  58. lsl.w #8,d3
  59.  
  60. instead of
  61. mw (a0),d3
  62. ?
  63. May be it is faster.
  64.  
  65. > Stephan
  66.  
  67. Greets,
  68. Phil.
  69. grond/matrix
  70.  
  71.